約 5,673,549 件
https://w.atwiki.jp/icabmobilemodule/pages/19.html
モジュールは単なるテキストファイルですが、気をつけるべき点が一つあります。 文字コードです。 モジュール内で日本語を使う場合(ダイアログやアプリ名などで)、Shift_JISやEUCなどを使うと正しくインストールされません。 UTF-8(改行コード CRLF)とすることで動作するようです。 ※詳しく調べたわけではありませんが、とりあえずの解決策として。
https://w.atwiki.jp/skill2linux/pages/16.html
基本的に、utf-8 を使用するのが好ましい。 だが、結構統一するのが面倒だったりする。 まず、 use utf8; を宣言して、スクリプト自体が utf8 を使用している事を明示化する。 ※ 旧 Perl は、色々な文字コードが存在しているため、utf8 であることを明示化する必要がある。 その次に、 標準出力、標準エラー出力、標準入力を明示化する binmode STDOUT, " utf8"; # 標準出力 binmode STDERR, " utf8"; # 標準エラー出力 binmode STDIN, " utf8"; # 標準入力 後は、 ソース自体の文字コードを utf8 にすること。 これで、記述するスクリプトは、utf8 で統一される。 ※ 標準入力(ようは受け取るデータ) が、utf8 じゃない場合は、やっちゃうとアウト ※ 例えば、OS の文字コードが、euc-jp とかだと、入ってくるデータがアレなので、駄目。 但し、他のライブラリの関数を使用した場合は、 戻り値や、エラーメッセージが utf8 で返ってこない可能性があるので、 文字コードを判断しなければならない。 例えば以下の場合… use utf8; eval { OPEN( IN, $file_path) or die "$!"; }; if($@) { print $@; } $@ に何の文字コードが入ってくるかは、状況によりけり。 その為、$@ が utf8 かを判断する必要がある。 その為、 以下のよう、utf8 に decode する。 use utf8; use Encode; eval { OPEN( IN, $file_path) or die "$!"; }; if($@) { # UTF8ではない場合 unless( utf8 is_utf8($@) { # utf8 にデコード(UTF8 に変換)する $@ = Encode decode( utf-8 , $@); } print $@; } 他の注意点としては、 標準出力、標準エラー出力、標準入力は既に utf8 としている為、 encode して出力する必要はないと言うこと。 encode( utf-8 , "あああ" ); としてしまうと、utf8 - utf8 で文字化ける。 但し、他の文字コードに変換するときは必須。 例えば、cp932 文字コードでファイル出力する場合は、 encode( cp932 , "あああ" ); で、明示的に変換する事。
https://w.atwiki.jp/taropi/pages/18.html
○文字コードの確認方法 kcc -c test.txt
https://w.atwiki.jp/ecomatatabi/pages/50.html
#から始まり0 ~9 A~Fまでの記号6個であらわされる文字コードの事です。 簡単なのは↓見てください、他にも色使いたい人は自分で調べてください。 色多すぎてフォローしきれませんので・・・ 16進数文字コード 色 #000000 ■ #808080 ■ #C0C0C0 ■ #FFFFFF ■ #FF0000 ■ #FFFF00 ■ #00FF00 ■ #00FFFF ■ #0000FF ■ #FF00FF ■ #800000 ■ #808000 ■ #008000 ■ #008080 ■ #000080 ■ #800080 ■
https://w.atwiki.jp/taichik15/pages/46.html
文字コードの変更 C-x RET f
https://w.atwiki.jp/hideaki0121/pages/157.html
ファイルの文字コードの設定 1.[ESC]+x (または Alt + x) 2.M-x set-buffer-file-coding-system 3.好きな文字コードを選ぶ Shift-JISなど
https://w.atwiki.jp/micromag/pages/45.html
inputファイルを作成する際、文字コードと改行コードに気をつける必要があります。例えば、Windowsで作成したファイルをUbuntuで開く場合、文字コードが間違っていると文字化けを起こします。また、Ubuntuで作成したファイルをWindowsで開く場合、改行コードが間違っていると改行されずに全文が1行で表示されます。 WindowsとUbuntuでどの文字コード、改行コードが認識されるかを調べたのが下表です。 Windows Ubuntu UTF-8 ○ ○ Shift-JIS ○ × ▲文字コード対応表 Windows Ubuntu LF × ○ CR+LF ○ ○ ▲改行コード対応表 両方のOSに対応しているのは、文字コードがUTF-8、改行コードがCR+LFですので、これらを使うとよいと思います。このwikiでダウンロードできるinputファイルにはUTF-8およびCR+LFを使用しています。
https://w.atwiki.jp/pgvb2010tj/pages/25.html
Shift JIS Unicode Base64 Shift JIS 文字の1バイト目を見るだけで漢字か1バイト文字か分かる Unicode すべての文字を16ビット(2バイト)で表現 Base64 データを64種類の印字可能な英数字のみを用いて、それ以外の文字を扱うことの出来ない通信環境にてマルチバイト文字やバイナリデータを扱うためのエンコード方式
https://w.atwiki.jp/tkonishi73/pages/448.html
2.文字コードの表現 ASCIIコード EBCDICコード JISコード 文字化けの起こる原因 シフトJISコード 日本語EUC Unicode(ユニコード)
https://w.atwiki.jp/dellkeitai/pages/30.html
* シフトJIS JIS8 EBCDIC JIS(78年度版) JIS(83年度版) JEF(富士通漢字) IBM(IBM漢字) KEIS(日立漢字) JIPS(E) JIPS(J) EUC-JP UTF-8 UTF-16 JISのみ Unicode 文字セット UCS-2 2バイト固定(65536文字) UCS-4 4バイトに拡張 Unicode3.1から実際に文字が割り当て エンコーディング UTF-32 4バイト固定 UTF-16 2バイト、または4バイト UCS-2の厳密なスーパーセットで、補助文字(1文字あたり4バイトが必要なサロゲート・ペア)をサポートする。 UTF-8 1~4バイト、日本語は3バイト 参考サイト http //www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/93.html Java System.out.print("サイズ " + str.getBytes().length); System.out.println("文字数 " + str.length()); 叱(U+20B9F)いう字だとサロゲートペアになるため、lengthだと正しくカウントされない。 1234567890 サイズ 10文字数 10 ABCDEFGHIJ サイズ 10文字数 10 あいうえお サイズ 15文字数 5 アイウエオカキクケコ サイズ 30文字数 10 しかる×5 サイズ 20文字数 10